CALCUL INFINITÉSIMAL - Calcul à une variable


CALCUL INFINITÉSIMAL - Calcul à une variable
CALCUL INFINITÉSIMAL - Calcul à une variable

Créée au XVIIe siècle par Newton, Leibniz et leurs prédécesseurs immédiats, transformée au XVIIIe, par Euler, en un prodigieux instrument de calcul, débarrassée, sous la Restauration, de sa métaphysique par le baron Cauchy, l’analyse infinitésimale a, depuis longtemps, atteint un degré de perfection tel qu’il est devenu possible d’en exposer l’essentiel en moins d’une dizaine de pages. C’est ce que nous allons essayer de faire, en renvoyant le lecteur à l’article qui précède pour des considérations historiques moins schématiques, et en nous plaçant ici au point de vue le plus «unidimensionnel» possible. Le lecteur qui désirerait un exposé plus philosophique et plus historique ne saurait mieux faire que de consulter l’ouvrage classique d’Otto Toeplitz. On n’a voulu, ici, exposer que les résultats les plus importants et les plus simples de la théorie classique à une variable, en s’efforçant de tout démontrer, et en ne demandant du lecteur que les connaissances les plus élémentaires sur les inégalités entre nombres décimaux, plus tout de même, cela va sans dire, une certaine habitude des raisonnements mathématiques.

1. Notion de borne supérieure

Nous désignerons par R l’ensemble des nombres réels ; il nous suffira de savoir qu’un nombre réel est un développement décimal illimité précédé d’un signe (qu’on omet s’il s’agit du signe +), par exemple le nombre 漣 3,141 59. ... ou bien le nombre 1 = 1,000 0.. ... = 0,999 99. ..., et que l’on peut effectuer sur ces nombres des opérations algébriques que tout le monde connaît. On peut aussi comparer deux nombres réels x et y , autrement dit donner un sens à la relation xy (qui exclut, notons-le, l’égalité x = y ). On peut, à partir de là, définir des intervalles de plusieurs natures; par exemple, si a et b sont deux nombres réels donnés, on définit quatre intervalles dont a et b sont les extrémités, et qui ne diffèrent entre eux que dans la mesure où ils contiennent, ou non, leurs extrémités: l’intervalle [a , b ] est l’ensemble des nombres x tels que axb , l’intervalle [a , b [ est formé des x tels que axb , etc. Les intervalles de la forme [a , b ] sont dits compacts , et les intervalles de la forme ]a , b [ sont dits ouverts .

Considérons maintenant un ensemble E de nombres réels. On dit qu’il est borné supérieurement s’il existe un nombre réel M tel que l’on ait x 諒 M pour tout x 捻 E (rappelons que cette notation signifie que le nombre x appartient à E, ou est un élément de E), et borné inférieurement s’il existe un nombre m tel que l’on ait mx pour tout x 捻 E. Si E est borné supérieurement et inférieurement (c’est-à-dire s’il existe un intervalle compact qui contient E), on dit que E est borné tout court. Par exemple, l’ensemble N des entiers naturels (ses éléments sont 0, 1, 2, ...) est borné inférieurement, mais non supérieurement, tandis que l’ensemble des nombres rationnels x tels que x 3 麗 2 est borné supérieurement (en effet x 3 麗 2 implique x 3 諒 8 = 23, d’où x 諒 2, comme on le voit facilement).

Soit E un ensemble borné supérieurement, et soit M un nombre tel que x 諒 M pour tout x 捻 E. S’il existe un nombre M 麗 M tel que l’on ait aussi x 諒 M pour tout x 捻 E, on obtient des informations plus précises sur les éléments de E en écrivant qu’ils sont tous inférieurs à M , qu’en écrivant qu’ils sont tous inférieurs à M (exemple concret: savoir que tout homme vit au plus 500 ans est mieux que rien, mais il vaut mieux savoir que tout le monde meurt avant 200 ans). Pour obtenir, de ce point de vue, les informations les plus précises possibles sur E, on est donc amené à choisir le nombre M aussi petit que possible, d’où la définition suivante: on dit que M est la borne supérieure de E si x 諒 M pour tout x 捻 E, et si, de plus, il n’existe aucun nombre M 麗 M possédant la première propriété, ou encore si, pour tout M 麗 M, il y a au moins un x 捻 E tel que M 麗 x 諒 M. Par exemple, la borne supérieure de l’intervalle [0, 1[ est le nombre 1: on a x 諒 1 dès que 0 諒 x 麗 1, et, pour tout M 麗 1, il y a des nombres x tels que l’on ait à la fois 0 諒 x 麗 1 et M 麗 x . On désigne par sup(E) la borne supérieure d’un ensemble E de nombres réels, et par inf(E) sa borne inférieure, définie de façon analogue en renversant les inégalités.

Théorème 1 . Tout ensemble non vide borné supérieurement de nombres réels possède une borne supérieure.

La démonstration très simple de ce théorème d’existence (il ne suffit pas de parler d’un objet possédant des propriétés données pour que l’objet en question existe) procède comme suit. Supposons, pour fixer les idées, que l’ensemble E considéré soit contenu dans l’intervalle [0, 1[; on notera 0, x 1x 2x 3... le développement décimal illimité de tout x 捻 E, de sorte que les chiffres x k sont des entiers compris entre 0 et 9. Nous allons construire les décimales successives a 1, a 2, ... de la borne supérieure cherchée a . On prend pour a 1 la plus grande valeur prise par la décimale x 1 de x lorsque x décrit E (autrement dit: on a x 1a 1 pour tout x 捻 E, et il existe un x 捻 E tel que x 1 = a 1); soit alors E1 l’ensemble des x 捻 E tels que x 1 = a 1; on prend pour a 2 la plus grande valeur prise par la décimale x 2 lorsque x décrit E1 ; soit alors E2 l’ensemble des x 捻 E1 tels que x 2 = a 2 (c’est-à-dire des x 捻 E dont les deux premières décimales sont a 1 et a 2); on prend pour a 3 la plus grande valeur prise par x 3 lorsque x décrit E2, et ainsi de suite indéfiniment. Considérons alors le nombre a = 0, a 1a 2a 3... ainsi construit. On a la relation xa pour tout x 捻 E, car si l’on a x 1 = a 1, ..., x p = a p (c’est-à-dire si x appartient à l’ensemble Ep construit plus haut), on a x p+1a p+1 par définition même de a p+1 ; on aboutit bien ainsi à la règle classique pour comparer deux développements décimaux. De plus, pour tout entier p , il y a effectivement des x 捻 E tels que l’on ait x 1 = a 1, ..., x p = a p , et donc a 10-pxa ; comme il existe, pour tout M 麗 a , un entier p tel que M 麗 a 10-p , il existe donc a fortiori un x 捻 E tel que M 麗 x .

Le théorème 1 et des énoncés analogues expriment toute la «métaphysique» du calcul infinitésimal, à savoir l’existence d’un nombre réel possédant un développement décimal arbitrairement donné. Toutes ces constructions s’écrouleraient si l’on ne connaissait que les nombres rationnels, car la borne supérieure d’un ensemble de nombres rationnels (par exemple de l’ensemble des x rationnels tels que x 2 麗 2) peut fort bien être irrationnelle (dans l’exemple considéré, c’est le nombre 連2).

Pour les applications à la théorie de l’intégration, nous aurons besoin d’un autre résultat, plus élémentaire.

Théorème 2 . Soit A et B deux ensembles non vides de nombres réels, et supposons xy pour tout x 捻 A et tout y 捻 B. Alors A est borné supérieurement, B borné inférieurement, et l’on a sup(A) 諒 inf(B). Pour que sup(A) = inf(B), il faut et il suffit que, pour tout entier p , il existe un x 捻 A et un y 捻 B tels que l’on ait y x 諒 10-p .

Comme B est non vide, il existe des nombres qui appartiennent à B, et qui par suite majorent tout x 捻 A: par suite A est borné supérieurement. A n’étant pas vide, le même raisonnement montre que B est borné inférieurement. Si y 捻 B, on a xy pour tout x 捻 A, et donc sup(A) 諒 y , puisque, par définition, sup A est le plus petit nombre qui dépasse tous les x 捻 A. Mais, comme sup(A) est inférieur à tous les y 捻 B, on en conclut, par un argument analogue, que sup(A) 諒 inf(B). Pour tout entier p il y a un x 捻 A et un y 捻 B tels que l’on ait:

d’où:

et par suite y x 諒 10-p si inf(B) = sup(A). Inversement, si l’on peut, pour tout p , trouver un x 捻 A et un y 捻 B tels que y x 諒 10-p , alors le fait que l’on a x 諒 sup(A) 諒 inf (B) 諒 y montre que inf(B) 漣 sup(A) 諒 10-p ; cela étant vrai pour tout p , il s’ensuit que sup(A) = inf(B).

La notion de borne supérieure d’un ensemble de nombres réels permet de définir celle de borne supérieure (ou de «maximum») d’une fonction à valeurs réelles . Soit X un ensemble (par exemple un intervalle dans l’ensemble des nombres réels) et f une fonction définie sur X et à valeurs réelles: f associe donc à chaque x 捻 X un nombre réel f (x ) qui, en général, dépend de x . Notons f (X) l’ensemble des nombres réels y tels qu’il existe un x 捻 X tel que y = f (x ) («image» de X par f ), autrement dit l’ensemble des «valeurs» prises par la fonction f (x ) lorsque x «décrit» X. On dit que f est bornée supérieurement (resp. inférieurement) sur X si l’ensemble f (X) est borné supérieurement (resp. inférieurement), c’est-à-dire s’il existe un nombre réel a tel que l’on ait f (x ) 諒 a (resp. f (x ) 閭 a ) pour tout x 捻 X. Le nombre sup(f (X)) [resp. inf(f (X))] s’appelle alors la borne supérieure (resp. inférieure) ou le maximum (resp. minimum) de la fonction f sur X, et on le désigne par l’assemblage de lettres et de signes que voici:

On peut donc caractériser le nombre M = sup f (x ) par les deux propriétés x 捻 X
suivantes:
(a) on a f (x ) 諒 M pour tout x 捻 X;
(b) pour tout entier p , il existe un x 捻 X tel que M 漣 10-pf (x ) 諒 M.

On fera attention au fait qu’il n’existe pas toujours un x 捻 X où l’on a exactement f (x ) = M, comme le montre le contre-exemple suivant: on prend pour X l’intervalle [0, 1[, ensemble des x réels tels que 0 諒 x 麗 1, et pour f la fonction f (x ) = x , dont le graphe est un segment de droite, comme chacun le sait; on a ici M = 1, mais f (x ) 麗 1 pour tout x 捻 X.

L’existence d’un nombre réel dont on se donne d’avance des approximations à 10-p près pour tout p peut encore se traduire par le résultat suivant (qui nous sera utile plus loin), habituellement connu sous le nom de «critère de Cauchy», bien que les énoncés qu’on en donne classiquement diffèrent légèrement de celui que l’on trouvera ci-dessous:

Théorème 3 . Soit x 1, x 2, ..., une suite illimitée de nombres réels. Supposons que, pour tout entier p , il existe un entier q tel que l’on ait |x mx n | 麗 10-p dès que m et n dépassent q . Alors il existe un nombre réel a tel que, pour tout p , on ait:

Nous supposerons (on s’y ramènerait facilement) que tous les nombres x i sont compris entre 0 et 1. Écrivons le développement décimal de x i sous la forme:

en désignant par x i k la k -ième décimale de x i , comprise entre 0 et 9. Comme on a:

il est clair (tout au moins si l’on néglige les difficultés accessoires dues aux développements décimaux impropres) que l’on peut supposer que les p 漣 1 premières décimales de x m et x n sont les mêmes dès que m et n dépassent q , autrement dit qu’à partir du rang n = q les p 漣 1 premières décimales de x n restent fixes. Faisant successivement p = 2, 3, ..., on voit donc qu’à partir de l’entier q 2 correspondant à p = 2 la première décimale x n 1 de x n aura une valeur fixe a 1, puisqu’à partir de l’entier q 3 correspondant à p = 3 la seconde décimale x n 2 aura en outre une valeur fixe a 2, et ainsi de suite indéfiniment. Considérons alors le nombre réel a = 0, a 1a 2a 3 ..., dont on vient de construire les décimales de proche en proche; choisissons un entier p quelconque et considérons l’entier q qui lui correspond d’après l’énoncé du théorème; pour tout nq , les p 漣 1 décimales de x n sont égales à celles de a , par construction même de a . On a donc:

il reste à montrer qu’on peut en fait, au second membre, remplacer 10-p+1 par 10-p . Pour cela choisissons un entier r quelconque; d’après ce que l’on vient de voir, on a |x ma | 諒 10-r pour tout m suffisamment grand (remplacer p par r + 1 dans ce qui précède); mais si l’on suppose m et n supérieurs à q on a aussi, par hypothèse, |x mx n | 諒 10-p ; combinant ces deux inégalités, on en conclut que l’on a:

et pour tout entier r . Cela étant valable pour tout r entraîne évidemment l’inégalité cherchée |x na| 諒 10-p , d’où le théorème.

On énonce habituellement le théorème 3 en termes de suites convergentes et de limites, mais nous ferons en sorte, ici, d’éviter l’usage de ces notions – ce qui est parfaitement possible – afin de faciliter la tâche du lecteur.

2. Intégrale d’une fonction étagée

Considérons, sur un intervalle compact X = [a , b ], une fonction f (x ) à valeurs réelles; nous la supposerons même, pour le moment, à valeurs positives. Si l’on trace le graphe de f , on obtient dans le plan une «courbe», l’ensemble des points (x , y ) tels que l’on ait x 捻 X et y = f (x ), qui délimite avec l’axe des abscisses et les verticales des points a et b une portion de plan dont on se propose de calculer la surface (dans l’hypothèse où la portion en question serait assez simple pour que l’on puisse attribuer une signification à ce calcul).

Les surfaces les plus simples à calculer sont celles des rectangles. On est ainsi amené à envisager d’abord un cas particulier, celui où l’on peut découper l’intervalle donné X en intervalles partiels X1, ..., Xp tels que la fonction f (x ) prenne, dans chaque Xk , une valeur constante a k ; noter que nous n’excluons aucunement le cas où certains Xk se réduiraient à un point, et que nous n’imposons pas aux Xk d’être compacts 漣 certains Xk peuvent contenir leurs extrémités, d’autres ne pas les contenir. Le graphe de la fonction f se compose alors de segments de droite horizontaux, et on dit que f est une fonction étagée . La portion de plan comprise entre le graphe et l’axe des x est alors (fig. 1) réunion de p rectangles ayant pour bases les intervalles Xk , et pour hauteurs les valeurs a k correspondantes. Supposant, ce qui est permis, les intervalles Xk deux à deux disjoints (c’est-à-dire sans points communs), nous appellerons alors, par définition, intégrale de f sur l’intervalle X le nombre:

l (X) désigne, d’une manière générale, la longueur d’un intervalle X. Le nombre I(f ) ainsi obtenu dépend naturellement de la fonction f considérée, mais non du découpage de l’intervalle X en intervalles partiels Xk sur lesquels f est constante; si, en effet, l’on découpe, d’une autre façon, X en intervalles deux à deux disjoints Y1, ..., Yq sur lesquels f prend les valeurs b 1, ... b q , de sorte que nous devons prouver que:

il est clair que chaque Xk est réunion de ses intersections Xk 惡 Yh avec les divers Yh ; ces intersections sont des intervalles deux à deux disjoints; on a donc:

d’où il résulte aussitôt que le premier membre de (2) est la somme de tous les nombres de la forme a k l (Xk 惡 Yh ), le second étant, de même, somme de tous les nombres b h l (Xk 惡 Yh ). Il suffit donc de montrer que l’on a a k l (Xk 惡 Yh ) = b h l (Xk 惡 Yh ) quels que soient k et h . Or la fonction f est égale, sur l’intersection Xk 惡 Yh , à la fois à a k et à b h ; si l’intersection n’est pas vide, on a donc a k = b h et le résultat s’ensuit; si l’intersection est vide, on a l (Xk 惡 Yh ) = 0, et le résultat cherché s’écrit 0 = 0; d’où la relation (2).

Nous utiliserons encore la relation (1) pour définir I(f ) lorsque la fonction f n’est plus positive.

Les intégrales des fonctions étagées possèdent des propriétés simples dont nous aurons besoin plus loin. Tout d’abord, si f et g sont deux fonctions étagées sur le même intervalle compact X, alors la fonction h = f + g donnée par h (x ) = f (x ) + g (x ) pour tout x 捻 X est encore étagée, et l’on a la relation:

En effet, si l’on partage X en intervalles Xi deux à deux disjoints, sur lesquels f prend des valeurs constantes a i (1 諒 ip ), et en intervalles deux à deux disjoints Yj , sur lesquels g prend des valeurs constantes b j (1 諒 jq ), il est clair que X est réunion des pq intervalles Xi 惡 Yj , que f + g prend sur Xi 惡 Yj la valeur constante a i + b j (d’où le fait que f + g soit étagée), et enfin que I (f + g ) est la somme de toutes les expressions (a i + b j ) l (Xi 惡 Yj ), c’est-à-dire des expressions a i l (Xi 惡 Yj ), dont la somme est égale à I (f ) comme on l’a vu plus haut, et des expressions b j l (Xi 惡 Yj ), dont la somme est égale à I (g ) pour des raisons analogues; d’où la relation (3).

On déduit évidemment de cette relation (3) que I(f g ) = I(f ) 漣 I(g ); et il est évident que:

pour toute constante c , en convenant de définir la fonction étagée cf = g par la condition que g (x ) = c . f (x ) pour tout x .

Enfin, si f est une fonction étagée (donc bornée) sur un intervalle compact X, on a l’inégalité:

où nous utilisons (pour la fonction étagée | f (x )|) la notion de borne supérieure définie à la fin du chapitre précédent. En effet, l’inégalité classique |a + b | 諒 |a | + |b |, appliquée à la définition (1) ci-dessus, montre que l’on a:

mais, si l’on pose M = sup | f (x )|, il est clair que M est le plus grand des p nombres |a 1|, ..., |a p |, d’où:

puisque les intervalles Xi sont deux à deux disjoints, et remplissent X tout entier.

3. Intégration des fonctions réglées

Considérons maintenant le cas général; nous ne supposons plus que la fonction f soit étagée, mais nous supposerons, pour éviter des difficultés secondaires, qu’elle est bornée , c’est-à-dire qu’il existe un nombre M tel que l’on ait 漣 M 諒 f (x ) 諒 M pour tout x 捻 X; pour le moment, supposons aussi f (x ) 閭 0 pour tout x . Soit 﨏 et 﨏 des fonctions étagées telles que l’on ait 0 諒 﨏 (x ) 諒 f (x ) 諒 﨏 (x ) pour tout x (il en existe: prendre 﨏 (x ) = 0 partout, et 﨏 (x ) = M partout, par exemple). L’aire limitée par l’axe des x et le graphe de f contient l’aire analogue relative à 﨏 , et est contenue dans l’aire analogue relative à 﨏 ; si l’on peut attribuer un sens raisonnable à l’intégrale I(f ) de la fonction f , on doit donc avoir la relation:

On est alors conduit, que f soit ou non positive , à introduire deux ensembles E et E de nombres réels: le premier sera formé des x tels qu’il existe une fonction étagée 﨏 sur X telle que l’on ait x = I( 﨏 ) et 﨏 諒 f (c’est-à-dire 﨏 (t ) 諒 f (t ) pour tout t 捻 X); le second sera l’ensemble des nombres réels x pour lesquels on peut trouver sur X une fonction étagée 﨏 vérifiant les relations f 諒 﨏 , et x = I( 﨏 ). La relation (6) exprime que le nombre I(f ) cherché est supérieur à tout x 捻 E, et inférieur à tout x 捻 E. Or l’ensemble E est borné inférieurement et E l’est supérieurement (les éléments de E sont évidemment inférieurs à ceux de E, puisque la relation 﨏 諒 﨏 , pour des fonctions étagées, implique visiblement l’inégalité I( 﨏 ) 諒 I( 﨏 ) entre leurs intégrales). Si nous désignons par m la borne supérieure de l’ensemble E, et par M la borne inférieure de l’ensemble E, la relation (6) exprime que l’intégrale cherchée de f doit être comprise entre m et M; noter que, comme tout élément de E est inférieur à tout élément de E comme on vient de le voir, on a aussi m 諒 M; pour que la relation m 諒 I(f ) 諒 M suffise à déterminer le nombre I(f ) cherché, il suffit donc de supposer que l’on a m = M. En vertu du théorème 2, les constructions qui précèdent déterminent donc sans ambiguïté I(f ) si la condition suivante est remplie: pour tout entier p , il existe sur X des fonctions étagées 﨏 et 﨏 telles que l’on ait d’une part 0 諒 﨏 (x ) 諒 f (x ) 諒 﨏 (x ) pour tout x 捻 X, et d’autre part I( 﨏 ) 漣 I( 﨏 ) 諒 10-p . S’il en est ainsi on dit que la fonction f est intégrable (au sens de Riemann) sur l’intervalle X, et l’on pose:

Il est sans doute prudent de déconseiller au lecteur toute tentative d’interprétation mathématique de l’assemblage de signes et de lettres figurant au premier membre, et qu’on ne peut expliquer qu’en faisant appel à la psychologie de Leibniz, sujet intéressant, mais qui nous entraînerait trop loin, probablement jusqu’aux philosophes grecs, trop curieux, qui se demandaient comment une étendue finie pourrait bien être obtenue en juxtaposant une infinité d’étendues infinitésimales. La réponse du mathématicien à ce genre de questions est de prier l’interlocuteur de bien vouloir lui fournir, au préalable, une définition mathématique des termes qu’il emploie, attendu que c’est la règle de base de toute discussion mathématique sérieuse (on trouve même des gens pour prétendre que le respect de cette convention n’est pas sans présenter quelque utilité en dehors des mathématiques); et c’est très exactement parce que personne, en vingt siècles, n’a été capable de lui fournir des définitions précises de ces termes que le mathématicien, en tant que tel, les rejette vers les ténèbres dialectiques de la métaphysique, de la psychologie et de l’histoire humaines, sans chercher à «comprendre» au sens des philosophes. À la limite, la seule chose qui intéresse le mathématicien, en tant que tel, est d’être en mesure de calculer des intégrales, voire, diraient beaucoup de gens, d’édifier des procédures mécanisées qui, introduites à l’entrée d’une calculatrice électronique, fourniront automatiquement le résultat cherché avec une marge d’erreur calculable. La définition des intégrales que nous venons d’exposer est éminemment adaptée à ce point de vue «opérationnel» 漣 il suffit de substituer, au calcul de I(f ), celui de l’intégrale I( 﨏) d’une fonction étagée 﨏 «suffisamment voisine» de f 漣 comme aussi, bien entendu, au point de vue «absolu» du mathématicien pur, qui désire poursuivre indéfiniment la construction du nombre I(f ) par approximations de plus en plus étroites. C’est probablement dans ce désir de précision absolue que se sont réfugiées les conceptions métaphysiques des Anciens et des classiques, puisqu’on n’imagine pas une machine calculant éternellement...

Indépendamment des problèmes de calcul pratique, qui n’intéressent pas le mathématicien, la notion d’intégrale serait inutilisable si l’on ne connaissait pas «beaucoup» de fonctions intégrables, et si l’on ne disposait pas de procédés mathématiques pour calculer (absolument, c’est-à-dire sans marge d’erreur) les intégrales de beaucoup de fonctions. Nous allons définir ici une catégorie de fonctions intégrables qui, en pratique, permet de couvrir tous les besoins de l’analyse classique.

Pour qu’une fonction f définie et bornée sur un intervalle compact X soit intégrable sur X, il faut et il suffit, comme on l’a vu plus haut, que l’on puisse trouver, pour tout entier p 閭 0, des fonctions étagées 﨏 et 﨏 sur X vérifiant les relations:

La seconde de ces relations s’écrit encore I( 﨏 漣 﨏 ) 諒 10-p . Or on a, d’après la relation (5) appliquée à la fonction étagée positive 﨏 漣 﨏 , l’inégalité:

en sorte que, pour réaliser la seconde condition (7) ci-dessus, il suffit de choisir les fonctions étagées 﨏 et 﨏 de telle sorte que l’on ait:

si l’on choisit un entier q tel que l (X). 10-q 諒 10-p , on est évidemment ramené à construire des fonctions étagées 﨏 et 﨏 vérifiant les conditions suivantes:

pour tout x 捻 X.

S’il est possible, quel que soit q , de trouver deux telles fonctions 﨏 et 﨏 , on dit que la fonction f est réglée sur l’intervalle X. Il est bien clair que ces considérations n’ont d’autre but que d’assurer le résultat (sic ) suivant:

Théorème 4 . Soit X un intervalle compact. Toute fonction réglée sur X est intégrable sur X.

Il est à peu près évident que, si f et g sont deux fonctions réglées sur X, il en est de même de leur somme f + g , de leur différence fg , et de leur produit fg = h , défini par la relation h (x ) = f (x )g (x ). On a de plus les relations:

(où c désigne une constante), qui résultent immédiatement des relations analogues (3) et (4) pour les fonctions étagées. Établissons par exemple la première. Pour chaque entier p , on peut par hypothèse trouver des fonctions étagées 﨏 , 﨏 , 祥 , 祥 vérifiant les conditions suivantes:

d’où résulte que I(f ) est égal à I( 﨏 ) à 10-p-1 près, et que I(g ) est égal à I( 祥 ) à 10-p-1 près aussi. Mais les fonctions étagées = 﨏 + 祥 et = 﨏 + 祥 vérifient évidemment les relations suivantes:

la seconde résultant du fait que l’on a:

Par suite, I(f + g ) est égal à 2.10-p-1 près à I( ) = I( 﨏 ) + I( 祥 ), lui-même égal à 2.10-p-1 près à I(f ) + I(g ), de sorte que I(f + g ) et I(f ) + I(g ) sont égaux à 4.10-p-1 près, à plus forte raison à 10-p près, et cela pour tout p : d’où la première relation (9).

À partir de la relation (5) établie pour les fonctions étagées on démontrerait, par des raisonnements analogues, que celle-ci est valable plus généralement pour les fonctions réglées. On l’exprime encore, en utilisant la notation de Leibniz, en écrivant que l’on a:

si |f (x )| 諒 M pour tout x 捻 [a , b ], résultat connu sous le nom de «premier théorème de la moyenne». En pratique, il est encore plus utile d’utiliser l’inégalité:

qui s’obtient immédiatement sur la formule (1) lorsqu’il s’agit de fonctions étagées, et qu’on étend ensuite facilement aux fonctions réglées par des arguments d’approximation analogues à ceux qu’on a déjà exposé plus haut.

4. Caractérisations des fonctions réglées

Soit f une fonction à valeurs réelles définie sur un intervalle X, et Y un intervalle (ou un ensemble) contenu dans X. Nous dirons que f est constante à 10-p près sur Y s’il existe un nombre c tel que l’on ait |f (x ) 漣 c | 諒 10-p pour tout x 捻 Y.

Théorème 5 . Soit f une fonction définie sur un intervalle compact X. Pour que f soit réglée dans X il faut et il suffit que pour tout entier p , on puisse partager l’intervalle X en un nombre fini d’intervalles partiels X1, ..., Xn tels que f soit constante à 10-p près dans chaque Xi .

C’est presque la définition. Si en effet on peut trouver, pour chaque Xi , une constante c i telle que |f (x ) 漣 c i | 諒 10-p pour tout x 捻 Xi , on peut immédiatement construire deux fonctions étagées 﨏 et 﨏 vérifiant 﨏 諒 f 諒 﨏 et 﨏 (x ) 漣 﨏 (x ) 諒 2.10-p pour tout x 捻 X, à savoir les fonctions qui dans chaque Xi , sont respectivement égales à c i 漣 10-p et à c i + 10-p . Inversement, si f est réglée, il est possible de réaliser les conditions (8) ci-dessus, puis de partager X en intervalles sur chacun desquels 﨏 et 﨏 sont constantes, et sur chacun desquels f est, par suite, constante à 10-q près (fig. 2).

Dans la pratique, on a besoin de caractériser les fonctions réglées par un critère exprimant que leur comportement «au voisinage de chaque valeur de la variable» est assez simple pour que f (x ) n’oscille pas d’une manière incontrôlable lorsque x se rapproche de plus en plus d’une «limite» donnée. Cela va nous obliger à développer quelques considérations sur les valeurs limites d’une fonction.

Soit f une fonction réglée sur un intervalle X, et soit a un point de X; considérons les valeurs de f aux points x 捻 X tels que ax (ce qui suppose a distinct de l’extrémité droite de X); nous allons montrer que lorsque x se «rapproche de plus en plus» de a , le nombre f (x ) «se rapproche de plus en plus» lui aussi d’une certaine valeur b bien définie, que l’on appellera la valeur limite à droite de f au point a . Noter que cette propriété est évidente si f est une fonction étagée; il y a en effet alors un aa tel que f (x ) soit constant dans l’intervalle axa (car si l’on décompose X en intervalles partiels sur chacun desquels f est constante, le point a est soit intérieur à l’un de ces intervalles, soit l’extrémité gauche de l’un d’entre eux); il est alors clair que si xa se rapproche de a , f (x ), qui ne bouge pas, se rapproche de plus en plus d’une valeur limite (à savoir de sa valeur, constante, dans l’intervalle axa ).

Dans le cas général, nous savons qu’il existe, pour chaque entier p , une partition de X en intervalles partiels sur chacun desquels f (x ) est constant à 10-p près. Pour chaque entier p , il y a donc dans X un point a pa tel que f (x ) soit constant à 10-p-2 près dans l’intervalle axa p , d’où un nombre réel b p tel que:

on peut évidemment supposer, si on le désire, que a 1a 2a 3 閭 ..., en remplaçant au besoin a p par a p-1 pour chaque p tel que a pa p-1 . Cela dit, choisissons un entier p et considérons les nombres b p , b p+1 , b p+2 , ...; si m et n sont deux entiers supérieurs à p , tels par exemple que pmn , considérons un x tel que axa n ; on aura aussi les inégalités axa m , d’où, à la fois:

ce qui montre évidemment que l’on a:

dès que m et n dépassent p . D’après le critère de Cauchy (théorème 3), il existe donc un nombre réel b tel que l’on ait |b b n | 諒 10-p-1 pour tout np , et en particulier pour n = p . Si axa p , on a alors à la fois |f (x ) 漣 b p | 諒 10-p-2 et |b pb| 諒 10-p-1 , d’où évidemment |f (x ) 漣 b | 諒 10-p .

Cela nous conduit à la notion de limite à droite: on dit qu’une fonction f (x ) définie sur un intervalle X possède en un point a de X une valeur limite à droite s’il existe un nombre b possédant la propriété que, pour tout p , il existe dans X un nombre apa tel que l’on ait |f (x ) 漣 b | 諒 10-p pour tout x tel que axa p (faire attention au fait que l’on n’impose aucune condition pour x = a ). Cela signifie encore que, pour tout p , il y a un intervalle axa p d’origine a dans lequel f (x ) est égal à b à 10-p près. S’il existe un tel nombre b , il est unique (car si b satisfait aux mêmes conditions, il existe, pour tout p , des xa où l’on a à la fois |f (x ) 漣 b | 諒 10-p-1 et |f (x ) 漣 b | 諒 10-p-1 , d’où |bb| 諒 10-p pour tout p , et finalement b = b ). Ce nombre b s’appelle, par définition, la valeur limite à droite de f au point a , et se désigne soit par la notation f d (a ), soit par la notation f (a + 0), artifice amusant pour rappeler que l’on considère la limite de l’expression f (a + h ) lorsque h tend vers 0 en restant strictement positif. Bien entendu, il ne faut pas, dans la notation précédente, remplacer a + 0 par a (l’assemblage a + 0 ne désigne pas, ici, la somme de deux nombres; il ne constitue qu’un graphisme dépourvu de tout autre sens que celui que nous lui avons attribué conventionnellement). En fait, il peut fort bien arriver que l’on ait f (a + 0) f (a ), comme le montre l’exemple fort simple de la fonction f (x ) définie quel que soit x réel par les formules suivantes :

On a ici f (1 + 0) = 1 et f (1) = 0 1.

On définirait, bien entendu, de même la notion de valeur limite à gauche de f au point a , notée f s (a ) ou f (a 漣 0): c’est un nombre b (forcément unique s’il existe) tel que, pour tout p , il existe dans X un a pa tel que la relation a pxa implique |f (x ) 漣 b | 諒 10-p (le nombre que nous désignons ici par a p n’a, bien entendu, aucun rapport avec celui que nous avons noté de la même façon plus haut). Au point où nous en sommes, nous avons évidemment démontré une moitié de l’énoncé fondamental que voici:

Théorème 6 . Pour qu’une fonction f définie sur un intervalle compact X soit réglée sur X, il faut et il suffit qu’elle admette en tout point de X des valeurs limites à droite et à gauche.

Il nous reste maintenant à montrer qu’inversement une fonction f qui admet, en chaque point a de X, des valeurs limites à droite et à gauche, est nécessairement réglée sur X. Choisissons pour cela un entier p ; nous devons prouver l’existence d’un nombre fini d’intervalles X1, ..., Xn possédant les propriétés suivantes: X est la réunion de X1, ..., Xn , et la fonction f (x ) est constante à 10-p près sur chacun des Xi .

Mais l’existence de valeurs limites montre que, pour chaque a 捻 X, il existe dans X des nombres a et a tels que l’on ait aaa et tels que la fonction f soit constante à 10-p près dans chacun des deux intervalles axa et axa (si a est l’extrémité gauche de X, on considère seulement a , et seulement a si a est l’extrémité droite de X). Désignons alors par I(a ) l’intervalle axa , dans le cas où a n’est pas une extrémité de X, et définissons I(a ) de la façon suivante, lorsque a est une extrémité de X: si a est l’extrémité gauche de X, on choisit arbitrairement un aa (donc en dehors de X), et on prend pour I(a ) l’intervalle axa , où a 捻 X est choisi comme ci-dessus; et si a est l’extrémité droite de X, on choisit arbitrairement, en dehors de X, un aa , et on prend pour I(a ) l’intervalle axa , où a 捻 X est choisi de telle sorte qu’on ait aa et que f soit constante à 10-p près dans l’intervalle axa . Les intervalles I(a ), pour tous les a 捻 X, jouissent alors des propriétés suivantes (fig. 3):

(a) chaque I(a ) contient a (de sorte que X est contenu dans la réunion des I(a ));

(b) chaque I(a ) est ouvert, c’est-à-dire de la forme ]a , a [, donc défini par des inégalités strictes de la forme axa ;

(c) l’intersection de X et de I(a ) peut se décomposer en trois intervalles au plus sur chacun desquels la fonction f est constante à 10-p près; si par exemple a est distinct des extrémités de X, ces trois intervalles sont ]a , a [, [a , a ] et ]a , a [; (noter qu’un intervalle peut fort bien être réduit à un seul point).

En raison de la propriété (c) ci-dessus, il suffirait, pour achever la démonstration du théorème 6, de prouver que l’on peut trouver des points a 1, ..., a n 捻 X en nombre fini tels que X soit contenu dans la réunion des intervalles I(a 1), ..., I(a n ), puisque, en décomposant chaque intersection X 惡 X(a i ) en, au plus, trois intervalles sur chacun desquels f est constante à 10-p près, on obtiendrait alors une décomposition de X en un nombre fini d’intervalles possédant chacun cette propriété. Tout revient donc, finalement, à établir le résultat suivant, qui peut servir à démontrer beaucoup d’autres théorèmes, et qui se généralise à beaucoup d’autres «espaces topologiques» que les intervalles compacts:

Théorème 7 (Borel-Lebesgue chez les francophones, Heine-Borel à l’étranger). Soit X un intervalle compact. Pour tout a 捻 X, soit I(a ) un intervalle ouvert contenant a . Il existe alors des points a 1, ..., a n de X en nombre fini tels que tout x 捻 X appartienne à l’un au moins des intervalles I(a 1), ..., I(a n ).

Soit u et v les extrémités gauche et droite de X, et considérons l’ensemble E 說 X des points x 捻 X qui possèdent la propriété suivante: on peut trouver des points a i 捻 X en nombre fini tels que tout point de l’intervalle compact [u , x ] appartienne à l’un au moins des intervalles I(a i ); tout revient à montrer que v 捻 E. On a évidemment u 捻 E, par exemple, parce que l’intervalle [u , u ] est contenu dans l’intervalle I(u ). L’ensemble E n’étant pas vide, et étant borné supérieurement (on a xv pour tout x 捻 E) admet donc (théorème 1) une borne supérieure av ; nous allons montrer que a 捻 E, puis que a = v , ce qui terminera la démonstration.

Considérons en effet l’intervalle ouvert I(a ) = ]a , a [ avec aaa . Comme a = sup (E), il existe un x 捻 E tel que axa . Comme x 捻 E, l’intervalle [u , x ] est contenu dans la réunion d’un nombre fini d’intervalles I(a 1), ..., I(a p ); posant a p+1 =a , il est alors clair que l’intervalle [u , a ], réunion de [u , x ] et de [x , a ], est contenu dans la réunion de I(a 1), ..., I(a p+1 ). Cela montre que a 捻 E.

Montrons enfin que a = v . Supposons en effet av . Posant I(a ) = ]a , a [, comme ci-dessus, il existe évidemment des x 捻 X tels que axa ; pour un tel x , l’intervalle [u , x ], réunion de [u , a ] et de [a , x ], est contenu dans la réunion de [u , a ] et de I(a ); comme l’on peut «recouvrir» [u , a ] à l’aide d’un nombre fini d’intervalles I(a i ) comme on vient de le démontrer, il en est donc de même de [u , x ]. Par suite, x 捻 E; ce qui est absurde puisque x est strictement supérieur au nombre a = sup (E). On a donc bien a = v , ce qui démontre le théorème 7, ainsi par conséquent que le théorème 6.

Les exemples les plus simples de fonctions réglées sont les fonctions continues . On dit qu’une fonction f est continue en un point a si elle admet en ce point des valeurs limites à droite et à gauche et si de plus on a f (a 漣 0) = f (a ) = f (a + 0). Il revient évidemment au même de dire qu’une fonction f , définie sur un intervalle X (compact ou non), est continue en a si, pour tout p , il existe un intervalle ouvert I(a ) contenant a et tel que f soit constante à 10-p près dans X 惡 I(a ). Lorsque f est continue en tout point de X, on dit que f est continue sur X. Le théorème 4 montre alors que, sur un intervalle compact, toute fonction continue est intégrable , résultat classique obtenu par Darboux en 1875, et dont on peut aujourd’hui donner, à partir de rien (la notion expérimentale de nombre réel conçu comme développement décimal illimité), une démonstration parfaitement rigoureuse et complète en quelques pages.

Parmi les fonctions réglées figurent aussi les fonctions monotones , c’est-à-dire les fonctions croissantes et les fonctions décroissantes; une fonction f , sur un intervalle X, est dite croissante dans X si, quels que soient x , x 捻 X, la relation xx implique f (x ) 諒 f (x ) 漣 la valeur de f (x ) augmente lorsque x augmente 漣 et décroissante si, au contraire, la relation xx implique f (x ) 閭 f (x ); ne pas se fier, pour ces notions, aux définitions bizarres et compliquées, bien que prétendument «intuitives», que l’on trouve encore dans de nombreux manuels. Pour montrer qu’une fonction f croissante, par exemple, est réglée, on considère un point quelconque a 捻 X et l’ensemble E des valeurs f (x ) prises par f aux points x 捻 X tels que xa ; comme f est croissante, on a toujours f (x ) 閭 f (a ) pour un tel x , et par suite E est borné inférieurement, donc admet une borne inférieure b = inf (E), dont nous allons montrer que c’est précisément la limite à droite f (a + 0), dont l’existence sera ainsi établie. Soit, en effet, p un entier quelconque; il y a dans E un nombre qui est égal à b à 10-p près, donc un a 捻 X vérifiant les relations aa et bf (a ) 諒 b + 10-p . Pour axa , on a alors d’une part bf (x ) puisque f (x ) 捻 E, et d’autre part aussi f (x ) 諒 f (a ), puisque f est croissante; il s’ensuit que l’on a bf (x ) 諒 b + 10-p , dès que axa , ce qui prouve très exactement que f admet, au point a , une valeur limite à droite égale à b . On établirait de même l’existence de valeurs limites à gauche.

5. Intégration et dérivation

Soit X un intervalle quelconque, et f une fonction réglée dans X, c’est-à-dire qui admet des limites à gauche et à droite en chaque point de X. Choisissons une fois pour toutes un point a de X. Pour tout t 捻 X, la fonction f est réglée et donc intégrable dans l’intervalle compact d’extrémités a et t . Nous nous proposons d’étudier la fonction F définie sur X par les formules suivantes:

Notons qu’en convenant de définir:

on a:

nous dirons que F est la primitive de f au point a . On a évidemment F(a ) = 0.

Les deux outils essentiels pour l’étude de F sont d’une part l’inégalité (10) démontrée plus haut, et d’autre part la relation:

valable quels que soient a , b , c 捻 X, et dont l’analogie avec la célèbre «relation de Chasles»:

de la théorie des segments de droite orientés est évidente. La démonstration de (17) consiste d’abord à utiliser la relation (16) et des calculs triviaux pour ramener la démonstration de (17) au cas où l’on a acb ; on vérifie alors (17) immédiatement lorsque f est une fonction étagée en utilisant la définition (1) de l’intégrale, puis on passe de là au cas général en appliquant (17) à des fonctions étagées «très voisines» de f , et en utilisant des arguments d’approximation analogues à ceux qui nous ont servi pour établir par exemple le théorème 4. Intuitivement, la relation (17) exprime que l’aire comprise entre le graphe de f , l’axe des x , et les verticales a et b , est somme de l’aire analogue comprise entre les verticales a et c , et de l’aire analogue comprise entre les verticales c et b , ce qui est «évident géométriquement», c’est-à-dire aussi longtemps qu’on n’exige pas de véritable démonstration...

Cela fait, revenons à la fonction F (t ). Pour un t 捻 X distinct de l’extrémité droite de X, on a t + h 捻 X pour tout nombre h 礪 0 suffisamment petit. Comme f admet en t une limite à droite f (t + 0), il y a, pour tout entier p , un nombre t pt dans X tel que la relation tt + ht p implique | f (t + h ) 漣 f (t + 0)| 諒 10-p . Posons b = f (t + 0) et considérons, pour un tel h , l’intégrale:

puisque:

Comme | f (x ) 漣 b | 諒 10-p pour txt + h , et comme les valeurs de f (x ) 漣 b , aux extrémités, n’ont évidemment aucune influence sur le calcul de l’intégrale, le premier théorème de la moyenne (10) montre que l’on a :

de là et de (18) résulte donc que l’on a:

dès que tt + ht p , ou, puisque h 礪 0, que:

dès que tt + ht p .

On est ainsi conduit à dire qu’une fonction F admet en un point t une dérivée à droite égale à b si, pour tout entier p , il existe un nombre t pt tel que l’on ait la relation (20), ou, si l’on préfère (poser t p = t + h p ), un nombre h p 礪 0 tel que la relation:

le rapport [F (t + h ) 漣 F (t )]/h représente, géométriquement, la pente de la droite joignant les points (t , F (t )) et (t + h , F (t + h )) du graphe de F. On désigne habituellement la dérivée à droite au point t , si elle existe, par F d (t ).

On définit bien entendu de même la notion de dérivée à gauche au point t : c’est un nombre c possédant la propriété que, pour tout p , il existe un nombre h p 麗 0 (aucun rapport avec ce que nous avons désigné ci-dessus par h p ) tel que:

Le raisonnement qui, pour la primitive F de f , nous a conduit à la relation (19) avec b = f (t + 0) conduirait, moyennant des modifications triviales, à la relation (22) avec cette fois c = f (t 漣 0). En résumé:

Théorème 8. Soit f une fonction réglée sur un intervalle X, et

la primitive de f en un point a de X. Alors la fonction F admet en chaque point t 捻 X des dérivées à droite et à gauche données par:

Le cas le plus fréquent est celui d’une fonction f partout continue ; alors F d (t ) = F g (t ) pour tout t 捻 X, ce qui exprime que la fonction F admet en chaque point t 捻 X une dérivée F (t ) = F g (t ) =F d (t ), donnée, puisque f(t 漣0)=f (t +0) = f (t ), par:

Nous allons maintenant montrer que cette relation suffit pour caractériser presque entièrement la fonction F, de sorte que le calcul des intégrales portant sur la fonction f reviendra à la détermination d’une solution F de l’équation (24) ; c’est là le cœur même du «calcul infinitésimal» tel que le concevaient les analystes du XVIIe siècle.

6. Détermination d’une fonction par sa dérivée

Soit F et G, deux fonctions admettant en un point t des dérivées F (t ) et G (t ); on voit facilement qu’alors les fonctions F + G, F 漣 G et FG admettent aussi, au point t , des dérivées données par des formules simples, et égales respectivement à:

La meilleure façon d’établir ces résultats est d’utiliser la notation de Landau (cf. calculs ASYMPTOTIQUES) et d’écrire, ce qui est clair d’après (19), qu’une fonction F admet au point t une dérivée égale à b si et seulement si l’on a la relation:

lorsque h tend vers 0; écrivant de même que:

lorsque h tend vers 0, avec c = G (t ), on en déduit par addition que:

d’où l’existence et le calcul de la dérivée de F + G...

Cela dit, et en nous bornant aux fonctions dérivables pour éviter des complications secondaires (mais les résultats que nous allons établir seraient encore valables, moyennant des modifications triviales, pour des fonctions admettant partout des dérivées à droite et à gauche), considérons deux solutions 1 et 2 de l’équation (24); la fonction F = 12 admet alors dans l’intervalle X considéré une dérivée:

On est alors amené à établir le résultat suivant:

Théorème 9 . Soit F une fonction définie dans un intervalle X et admettant, en tout point de X, une dérivée égale à 0. Alors la fonction F est constante dans X.

Si l’on admet ce théorème, on voit que deux solutions quelconques de (24) diffèrent entre elles d’une simple constante . Si doncl’on connaît une solution F de (24), et si l’on choisit un point a de X, on aura une relation de la forme:

c est une constante indépendante de t . En particulier, pour t = a , on obtient la relation:

Autrement dit:

Théorème 10 . Soit f une fonction continue dans un intervalle X et F une fonction dérivable dans X telle que F (t ) = f (t ) pour tout t 捻 X. On a alors:

quels que soient a, b 捻 X.

C’est ce qu’on appelle fréquemment le théorème fondamental du calcul infinitésimal puisqu’il montre l’équivalence entre les deux problèmes suivants: calculer

pour toutes les valeurs possibles de a et b ; trouver une fonction F telle que F (t ) = f (t ) quel que soit t . Si, par exemple, l’on sait – la chose se démontre dans les lycées et collèges – que la dérivée de la fonction x 15 est 15x 14, de sorte qu’on a F (t ) = f (t ) si f (t ) = x 14 et F(t ) = x 15/15, on peut immédiatement écrire:

quels que soient a et b , sans autre calcul.

7. Théorème des accroissements finis

Il nous faut maintenant démontrer le théorème 9, c’est-à-dire prouver que l’on a F(a ) = F(b ), quels que soient a et b dans X. L’idée de la démonstration est d’une extrême simplicité, et fort ingénieuse. Elle consiste à observer que, si l’on contemple le graphe F dans l’intervalle ]a , b [, on peut trouver un point c de cet intervalle où la tangente au graphe de F (fig. 4) est parallèle à la «corde» joignant les points (a , F(a )) et (b , F(b )) du graphe; si F(a ) F(b ), cette corde n’est pas horizontale, la tangente en c non plus, et l’on a par suite F (c ) 0, contrairement à l’hypothèse!

Mais ce raisonnement purement géométrique doit être rendu rigoureux grâce à une démonstration effective de l’existence du point c en question. Noter que la pente de la corde joignant les points (a , F(a )) et (b , F(b )) est égale à:

Nous sommes donc ramenés, pour établir le théorème 9, à établir le résultat bien plus utile encore que voici:

Théorème 11 (formule des accroissements finis). Soit F une fonction dérivable dans un intervalle compact [a , b ]. Il existe un point c 捻 ]a , b [ où l’on a:

(Par une fonction dérivable sur [a , b ] nous entendons une fonction qui admet une dérivée en tout point x tel que axb , ainsi qu’une dérivée à droite en a et une dérivée à gauche en b . On démontre souvent le théorème 11 sans supposer l’existence de ces dérivées en a et b .)

Notons d’abord qu’il suffit d’établir le théorème 11 pour les fonctions F telles que F(a ) = F(b ). Supposons-le en effet établi moyennant cette hypothèse supplémentaire, et substituons à la fonction F donnée la fonction:

on a évidemment G(a ) = F(a ), et G(b ) = F(b ) 漣 [F(b ) 漣 F(a )] = F(a ) = G(a ). De plus, il est clair que G admet partout dans X une dérivée donnée par:

puisque la dérivée d’une fonction linéaire ct + d est égale à c . Établi pour G, le théorème 11 exprime l’existence d’un nombre:

ce qui, d’après (29), fournit aussitôt la relation (28) pour la fonction F.

Nous pouvons donc bien supposer F(a ) = F(b ) = 0; le théorème 11 s’énonce alors comme suit:

Théorème 11 bis. Soit F une fonction dérivable dans un intervalle compact [a , b ] et telle que F(a ) = F(b ). Il existe un point c 捻 ]a , b [ où l’on a F (c ) = 0.

Ce résultat est connu sous le nom de «théorème de Rolle», académicien français de la fin du XVIIe siècle, et resté célèbre pour avoir eu le premier, du moins le suppose-t-on, l’idée géométrique d’une démonstration du théorème 11 bis . Cette idée, identique à celle que nous avons exposée au début de ce chapitre, consiste à remarquer que le théorème 11 bis exprime l’existence d’un point du graphe de F où la tangente à celui-ci est horizontale ; et la meilleure façon de trouver un tel point (c’est du moins l’impression que l’on retire d’une réflexion géométrique simple) consiste à le chercher parmi les points où la fonction F est maximum ou minimum (fig. 5).

Supposons en effet trouvé un point c vérifiant les conditions suivantes; on a:

pour tout x 捻 [a , b ]. Le rapport:

défini pour tout h 0 assez petit (parce qu’on suppose c distinct des extrémités a et b de l’intervalle considéré) est alors positif ou nul pour h 麗 0 (quotient de deux nombres négatifs), et négatif ou nul pour h 礪 0. Mais si |h | est suffisamment petit, ce rapport est égal, à 10-p près, à F (c ); on en conclut que F (c ) doit être à la fois positif et négatif, ce qui prouve que F (c ) = 0. On parviendrait évidemment à la même conclusion en supposant:

pour tout x 捻 [a , b ].

On voit ainsi qu’en définitive les théorèmes 9, 10 et 11 reposent sur l’existence d’un point c vérifiant soit les conditions (30), soit les conditions (31).

8. Théorème du maximum

Comme nous allons le voir, il suffit pour cela d’établir le résultat suivant:

Théorème 12 . Soit F une fonction définie et continue sur un intervalle compact X. Il existe un c 捻X tel que l’on ait F(x ) 諒 F(c ) pour tout x 捻 X, et un c 捻 X tel que l’on ait F(c ) 諒 F(x ) pour tout x 捻 X.

Avant d’établir le théorème 12, montrons comment il implique le théorème 11 bis . Tout d’abord la fonction F du théorème 11 bis , étant dérivable en tout point de X, est continue. En effet, pour tout t 捻 X, il existe, d’après les relations (21) et (22), que l’on écrira pour p = 0, des nombres h et h tels que l’on ait h 麗 0 麗 h et tels que:

(le cas où h = 0 est exclu de (21) et (22), mais se traite directement par vérification triviale). Posant M = 1 + |F (t )|, on en déduit que l’on a |F(t + h ) 漣 F(t )| 諒 M |h | pour hhh . Choisissons un entier n tel que M 諒 10n ; alors M |h | 諒 10-p pourvu que |h | 諒 10-p-n . Les t tels que le nombre h = tt vérifie à la fois hhh et |h | 諒 10-p-n forment un intervalle ouvert I(t ) contenant le point t , et le raisonnement précédent montre que, pour t 捻 X 惡 I(t ), on a |F(t ) 漣 F(t )| 諒 10-p , autrement dit que F est constante à 10-p près dans X 惡 I(t ): d’où la continuité de F en t (cf. fin du chap. 5).

Cela dit, le théorème 12 s’applique à F, d’où des points c et c dans X tels que l’on ait F(c ) 諒 F(x ) 諒 F(c ) pour tout x 捻 X. Si l’on a acb , la condition (30) est réalisée; si l’on a acb , la condition (31) l’est, et dans chacun de ces deux cas le théorème 11 bis est démontré, comme on l’a vu. Il reste à examiner le cas où c et c sont situés aux extrémités de X. Mais comme F(a ) = F(b ), on a alors F(c ) = F(c ) = F(a ) = F(b ), donc F(x ) = F(a ) = F(b ) pour tout x 捻 X, et la fonction F est constante, d’où F (t ) = 0, quel que soit t 捻 X, de sorte que le théorème 11 bis est trivialement vrai dans ce cas aussi.

Passons maintenant à la démonstration du théorème 12 . Tout d’abord la fonction, étant continue sur l’intervalle compact X, est réglée sur X d’après le théorème 6, comme nous l’avons déjà observé au chapitre 5; elle est donc bornée sur X: choisir sur X une fonction étagée 﨏 telle que l’on ait par exemple |F(x ) 漣 﨏(x )| 諒 1 pour tout x 捻 X, désigner par u et v la plus petite et la plus grande des valeurs (en nombre fini) prises par la fonction 﨏 sur X, et observer qu’on a alors u 漣 1 諒 F(x ) 諒 v + 1 pour tout x 捻 X. L’ensemble F(X) des valeurs prises par la fonction F sur l’intervalle X est donc borné et admet par suite une borne supérieure M et une borne inférieure m (cf. chap. 1); toute la question est de prouver l’existence de nombres c et c 捻 X tels que m = F(c ) et M = F(c ) (ce qui, nous l’avons vu au chapitre 1, pourrait fort bien se révéler impossible si l’intervalle X n’était pas supposé être compact ), et nous nous bornerons à prouver l’existence de c , celle de c se démontrant de la même façon (ou, mieux encore, se déduisant de l’existence de c puisque c joue pour la fonction 漣 F le même rôle que c pour la fonction F).

Or nous savons que, pour tout p , il existe des x 捻 X où l’on a M 漣 10-p 諒 F(x ) 諒 M. Soit Ap l’ensemble de ces x 捻 X; tout revient à prouver qu’il existe un point c commun à tous les Ap , car si l’on a:

quel que soit p , on aura évidemment aussi F(c ) = M. Nous allons maintenant raisonner par l’absurde, en supposant que les ensembles Ap n’ont aucun point commun et en déduisant de là une contradiction.

Si les Ap n’ont aucun point commun, alors, pour tout x 捻 X, il existe un entier p tel que x 殮 Ap , c’est-à-dire tel que l’on ait F(x ) 麗 M 漣 10-p . Comme F est continue en tout point de X, il existe alors un intervalle ouvert I(x ) contenant x , et tel que F soit constante à 10-p-1 près dans X 惡 I(x ); pour tout x 捻 X 惡 I(x ) on a donc alors F(x ) 諒 M 漣 10-p + 10-p-1 麗 M 漣 10-p-1 puisque l’on a:

comme on le voit en observant que 漣 9 麗 漣 1. Désignant par q l’entier p + 1 on voit donc que, pour tout x 捻 X, il existe un intervalle ouvert I(x ) contenant x et un entier q tels que l’on ait:

pour tout x 捻 I(x ) 惡 X.

Appliquons alors le théorème 7; on trouve des points x 1, ..., x n de X, en nombre fini, et des entiers q 1, ..., q n , tels que les conditions suivantes soient remplies; tout x 捻 X appartient à l’un au moins des intervalles I(x 1), ..., I(x n ), et d’autre part on a, d’après (33) appliqué à chaque x k ,

pour tout x 捻 I(x k ) 惡 X.

Soit q le plus grand des n entiers q 1, ..., q n ; on a évidemment 10q k 諒 10q , et donc:

pour tout k tel que 1 諒 kn ; par suite, (34) montre que F(x ) 麗 M 漣 10-q pour tout x 捻 X qui appartient à l’un au moins des I(x k ), c’est-à-dire pour tout x 捻 X sans exception. Mais on aboutit ici à une contradiction puisque, par définition de la borne supérieure M de la fonction F, il existe certainement des x 捻 X où l’on a F(x ) 閭 M 漣 10-q . Le théorème 12 est donc démontré, et avec lui les théorèmes 11, 10 et 9.

9. Formule de Taylor

Nous allons maintenant établir le dernier «grand» résultat de l’analyse infinitésimale, à savoir la formule de Taylor, qui permet, au voisinage d’un point, de remplacer une fonction «suffisamment régulière» par un polynôme qui lui est «approximativement» égal.

Soit f une fonction définie dans un intervalle ouvert X. Nous dirons que f est de classe C1 dans X si elle admet une dérivée f (x ) en tout point de X, et si celle-ci est fonction continue de x . Si f est elle-même de classe C1, on dit que f est de classe C2; on peut alors attribuer à f une dérivée seconde continue f = (f ) . En poursuivant ainsi de proche en proche on définit de façon évidente les dérivées successives, et la notion de fonction de classe Cp , c’est-à-dire admettant dans X des dérivées continues jusqu’à l’ordre p inclusivement.

Supposons f de classe C1 dans X, et appliquons le théorème 10 à la fonction continue f ; on trouve que:

quels que soient a , b 捻 X.

Soit maintenant u et v deux fonctions de classe C1 dans X; la fonction w = uv l’est aussi et sa dérivée est donnée par la formule w = u v + uv , que nous avons déjà indiquée après l’énoncé du théorème 11. On en déduit que:

d’où la formule d’intégration par parties :

valable pour u et v de classe C1 dans X, très commode pour le calcul pratique des intégrales, mais dont l’intérêt est ailleurs lorsqu’on s’occupe de mathématiques. Nous allons obtenir la formule de Taylor en combinant les formules (35) et (36).

Pour cela supposons, dans (35), que f soit de classe C2 et donc f de classe C1. Appliquons la formule (36) en choisissant u (x ) = x b , d’où u (x ) = 1, et v (x ) = f (x ), d’où v (x ) = f (x ); il vient u (b ) = 0, u (a ) = a b , v (b ) = f (b ), v (a ) = f (a ), d’où:

Supposons maintenant f de classe C3, donc f de classe C1; on peut calculer la dernière intégrale en faisant u (x ) = f (x ) et v (x ) = (x b )2/2 dans la formule (36), puisque alors v (x ) = x a ; il vient donc, puisque v (b ) = 0:

Si f est de classe C4, on peut calculer la dernière intégrale en prenant, dans la formule d’intégration par parties, u (x ) = f t (x ) et v (x ) = (x b )3/2.3; comme v (b ) = 0, il vient alors manifestement:

Il est clair que le raisonnement se poursuit aussi longtemps que les dérivées existent et sont continues. Autrement dit, si f est de classe Cp+1 , on a la relation:

où l’on a posé p ! = 1.2....p (produit des p premiers nombres entiers), et où l’expression Rp est donnée par la relation:

La formule de Taylor avec reste intégral est la relation:

qui se déduit immédiatement de (37). Si l’on fixe le point a en remplaçant b par un point variable t 捻 X, on obtient la relation:

qui exprime f comme somme d’un polynôme en t et d’un «reste»:

Noter que le polynôme en question possède, au point a , les mêmes dérivées que la fonction f jusqu’à l’ordre p inclusivement , ce qui le caractérise entièrement puisqu’il est de degré p au plus.

La formule de Taylor n’a pas d’intérêt si l’on ne connaît pas de méthode simple pour évaluer l’ordre de grandeur du reste Rp dans (39) ou (40) puisque, dans la pratique, on désire toujours s’en servir pour approcher la fonction f par le polynôme de degré p considéré ci-dessus. Supposons pour cela ab dans (38), l’autre cas se traite de même, avec des changements de signe triviaux dans les raisonnements, de sorte que l’on a (b x )p 閭 0 pour axb . Soit m et M le minimum et le maximum, dans l’intervalle compact [a , b ], de la fonction continue f (p+1) (x ); on a alors:

de sorte que tout revient à évaluer l’intégrale:

Pour cela, appliquons la formule (39) à la fonction f (x ) = (x a )p+1 /(p + 1)!, dont les dérivées successives sont (x a )p /p !, ..., x a et 1 pour la dérivée d’ordre p + 1; les dérivées d’ordre 諒 p sont nulles pour x = a , de sorte que, pour cette fonction, la formule (39) se réduit à son reste, précisément égal à (43) puisque l’on a, pour la fonction considérée, f (p+1) (x ) = 1 pour tout x ; d’où la valeur de l’intégrale (43), à savoir:

Portant dans (42) on trouve donc, pour le reste (38) associé à une fonction f de nouveau quelconque, les inégalités:

ce qui montre encore que l’on a:

On ne connaît pas exactement le nombre k , mais on sait qu’il est compris entre le minimum et le maximum, sur l’intervalle [a , b ], de la fonction continue f (p+1) (x ); en appliquant à f (p+1) le théorème 14 qui sera démontré ci-dessous, on en conclut qu’il existe dans l’intervalle [a , b ] un point c où l’on a k = f (p+1) (c ); portant dans (46) et (39), on obtient finalement le résultat suivant:

Théorème 13 . Soit f une fonction de classe Cp+1 sur un intervalle X. Quels que soient les points a et b de X, il existe un nombre c compris entre a et b et tel que l’on ait:

Il nous reste à établir le théorème 14, auquel nous avons fait allusion plus haut; c’est, de toute façon, l’une des propriétés les plus importantes des fonctions continues.

Théorème 14 . Soit m et M le minimum et le maximum d’une fonction continue sur un intervalle compact [a , b ]. Pour tout nombre k compris entre m et M, il existe un nombre c compris entre a et b et tel que k = f (c ).

On sait (théorème 12) qu’il existe dans [a , b ] des points a et bf (a ) = m et f (b ) = M; remplaçant l’intervalle [a , b ] par l’intervalle [a , b ], on est encore ramené à l’énoncé suivant («théorème des valeurs intermédiaires», fig. 6):

Théorème 14 bis. Soit f une fonction continue sur un intervalle X, a et b deux points de X, et k un nombre compris entre a et b . Il existe un nombre c compris entre a et b tel que f (c ) = k .

Pour fixer les idées, supposons ab et f (a ) 諒 kf (b ). Soit E l’ensemble des points x 捻 [a , b ] où l’on a f (x ) 諒 k ; l’ensemble E n’est pas vide (on a visiblement a 捻 E), et il est borné supérieurement (on a xb pour tout x 捻 E); il admet donc (théorème 1) une borne supérieure c . Comme xb pour tout x 捻 E on a aussi cb ; comme a 捻 E on a aussi ac , de sorte que c 捻 [a , b ]. Nous allons montrer que f (c ) = k , ce qui prouvera le théorème. Il suffit pour cela de montrer que l’on ne peut avoir ni f (c ) 礪 k , ni f (c ) 麗 k .

Supposons que l’on ait f (c ) 礪 k . On aurait alors a c puisque f (a ) 諒 k , et donc aussi ac . D’autre part, il existerait un entier p tel que l’on ait encore:

puisque l’inégalité f (c ) 礪 k est stricte. Mais f est continue au point c ; il y a donc un intervalle ouvert I(c ) contenant c et tel que f soit constante à 10-p près dans [a , b ] 惡 I(c ). Comme ac , cette intersection contient au moins un c tel que acc , donc contient tout l’intervalle [c , c ], lequel, puisque c = sup (E), contient certainement un x 捻 E. On a alors f (x ) 諒 k , puisque x 捻 E, et:

puisque x 捻 I (c ), d’où:

ce qui contredit (48). L’éventualité dans laquelle on aurait f (c ) 礪 k est donc exclue.

Supposons maintenant que l’on ait f (c ) 麗 k . Comme kf (b ), on a alors certainement cb . Comme, d’autre part, l’inégalité f (c ) 麗 k est stricte, il existe, comme plus haut, un entier p tel que l’on ait:

Mais f est continue au point c ; il y a donc, comme plus haut, un intervalle ouvert I(c ) contenant c et dans lequel la fonction f est égale, à 10-p près, à f (c ). Comme cb , il y a un c 捻 I(c ) 惡 [a , b ] tel que cc , et, comme on a |f(c ) 漣 f (c )| 諒 10-p , il vient:

d’après (49). Par suite c 捻 E; mais c’est absurde puisque c dépasse strictement la borne supérieure c de l’ensemble E. Le théorème 14 bis est donc démontré, et, avec lui, la formule de Taylor.

Les applications principales de la formule de Taylor concernent les développements en série des fonctions «élémentaires»: fonctions trigonométriques, exponentielles, logarithmiques, etc. (cf. EXPONENTIELLE ET LOGARITHME, FONCTIONS ANALYTIQUES). On trouvera également, dans l’article suivant, l’extension de la formule de Taylor aux fonctions de plusieurs variables.

Encyclopédie Universelle. 2012.